iT邦幫忙

2025 iThome 鐵人賽

DAY 29
0
生成式 AI

30天生成式AI入門與實作日記系列 第 29

[Day 29] 第四週心得:實作中我真的學到的那些事

  • 分享至 

  • xImage
  •  

這禮拜我覺得最有趣的不是把程式跑起來,而是從實作的過程中,慢慢真的懂AI在做什麼。
今天這篇就不寫程式,單純整理幾個我這次做AI問答機器人過程中學到的觀念。

  1. Tokenizer是怎麼讓模型看懂文字的
    一開始我只知道要先載入Tokenizer,然後把文字轉成token,但實際操作之後才發現,Tokenizer根本就是模型的「語言轉譯器」。
    我們打進去的文字,其實會先被切成一堆數字編碼,模型不是直接看句子,而是看這些token在語料中的位置與關係。
    這也讓我理解為什麼有時候中英文混著寫會怪怪的,因為Tokenizer切法不同,會影響模型看到的內容。
  2. Prompt設計真的會改變結果
    在做摘要和翻譯的時候,我一開始都只是寫「Summarize this text」或「Translate this」。
    後來發現如果加上更明確的規則,例如:
Produce EXACTLY three English sentences.
Each sentence ≤ 25 words.
No extra text.

生成結果就會明顯更穩定。
這讓我發現,Prompt其實不只是指令,而是在教模型你想要的風格和格式。
好的Prompt可以少debug一半的時間
3. 模型不是萬能的,它只是有條件的聰明
在做問答時,有時候AI答錯,我會覺得它是不是壞掉了。
但後來才懂,模型其實不是真的理解內容,它是根據訓練時見過的資料分佈在預測下一個字。
所以如果我問它沒看過的題材,它會憑語感亂猜。
這也是為什麼有RAG這種技術出現,讓AI在回答前可以先查資料
4. Hugging Face是整個開源AI界的寶庫
這次專案是我第一次用Hugging Face來登入、抓模型。
以前只覺得它是個模型倉庫,但這次才知道它還能管理token、追蹤版本、甚至幫忙部署。
而且每個模型頁面都有範例code,照著跑就能少出錯。
5. 能動不代表能用
這是我這次最大的體悟。
程式跑得起來只是第一步,但要讓別人看得懂、能順利使用、結果穩定,那才是真的在做一個應用。
這就是我後來會去寫使用手冊的原因。

寫到這裡,我其實有一點感慨。
從一開始單純想試模型,到真的寫出一個能互動的AI,中間每一步都讓我更理解AI的底層原理,也更尊重那些做AI產品的人。

明天就是最後一天了!!
下一篇,我會好好寫下這30天的完整心得與收穫。


上一篇
[Day 28] AI問答機器人的未來:從工具到智慧助理
下一篇
[Day 30] 完成!從一行程式到一個AI作品的30天
系列文
30天生成式AI入門與實作日記30
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言